Intégration de connaissances syntaxiques dans les modèles de langue pour la RI

نویسنده

  • Loïc Maisonnasse
چکیده

In Information Retrieval (IR), statistic keyword based methods have reached a limit. This limit can only be cross by integrating, in large number outside source of knowledge, in IR system. Our work is based on the integration of the syntactic link between the terms produced by shallow parser. For that we consider the syntactic dependency of dependency tree produce by parser. For integrating these information in IR, we present the use of a language modeling approach. Language modeling approach theoretically framework is attractive as it can be adapted or in order to take into account new information. We present here the integration of the dependency relation in a language model. We evaluate this model on a part of the CLEF collection. The results show that the integration of dependency relation lowers the IR results. Consequently, knowing these results in the continuation of this work, we intend to integrate more semantic information instead of syntactic information. MOTS-CLÉS : recherche d’information, analyse syntaxique, dépendance syntaxique, modèle de langue

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Stratégies pour l'étiquetage et l'analyse syntaxique statistique de phénomènes difficiles en français : études de cas avec Talismane

RÉSUMÉ. Les outils statistiques robustes en TAL, tels que les étiqueteurs morphosyntaxiques et les analyseurs syntaxiques, utilisent souvent des descripteurs « pauvres », qui peuvent être appliqués facilement à n’importe quelle langue, mais ne prennent pas en compte les particularités de la langue. Dans cette étude, nous cherchons à améliorer l’analyse de deux phénomènes en français en injectan...

متن کامل

Continuous space models with neural networks in natural language processing. (Modèles neuronaux pour la modélisation statistique de la langue)

Les modèles de langage ont pour but de caractériser et d’évaluer la qualité des énoncés en langue naturelle. Leur rôle est fondamentale dans de nombreux cadres d’application comme la reconnaissance automatique de la parole, la traduction automatique, l’extraction et la recherche d’information. La modélisation actuellement état de l’art est la modélisation "historique" dite n-gramme associée à d...

متن کامل

Explorer des actualités multimédia dans le Web de données

Résumé : Pour faciliter l’échange des actualités, l’IPTC (International Press Telecommunication Council) a développé l’Architecture NewsML (NAR) composée d’un modèle XML pour représenter les métadonnées et de vocabulaires contrôlés (IPTC News Codes) pour catégoriser les dépêches de presse. D’autres formats de métadonnées spécifiques au multimédia peuvent être utilisés conjointement mais cela po...

متن کامل

Traduction automatique de termes biomédicaux pour la recherche d'information interlingue

RÉSUMÉ. Dans cet article, nous présentons une méthode de traduction automatique de termes biomédicaux. Cette méthode s’appuie sur une technique originale d’apprentissage supervisé de règles de réécriture et sur l’utilisation de modèles de langue. Les évaluations présentées montrent que notre technique est très performante et permet de traduire à partir et à destination de n’importe quelle langu...

متن کامل

Un formalisme pour la gestion des connaissances. Approche ingénierie dirigée par les modèles

RÉSUMÉ. Les nombreux travaux de recherche autour de IDM (ingénierie dirigée par les modèles) montrent que la gestion de modèles prend une importance grandissante et intervient dans divers domaines comme la gestion des connaissances, la gestion de métadonnées, les ontologies, la qualité de service et le génie logiciel. La représentation de modèles est fondamentale pour la gestion de modèles. Com...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2006